home *** CD-ROM | disk | FTP | other *** search
/ PC World Komputer 2003 November A / PCWK1103A.iso / Adobe After Effects 6.0 tryout / MM4.Cab / F3609_GUJARATI.TXT.942461E0_7FE8_440B_86B6_AA6592C2EC51 < prev    next >
Text File  |  2003-03-20  |  14KB  |  379 lines

  1. ##Adobe File Version: 1.000
  2. #=======================================================================
  3. #   FTP file name:  GUJARATI.TXT
  4. #
  5. #   Contents:       Map (external version) from Mac OS Gujarati
  6. #                   encoding to Unicode 2.1
  7. #
  8. #   Copyright:      (c) 1997-1999 by Apple Computer, Inc., all rights
  9. #                   reserved.
  10. #
  11. #   Contact:        charsets@apple.com
  12. #
  13. #   Changes:
  14. #
  15. #       b02  1999-Sep-22    Update contact e-mail address. Matches
  16. #                           internal utom<b1>, ufrm<b1>, and Text
  17. #                           Encoding Converter version 1.5.
  18. #       n02  1998-Feb-05    First version; matches internal utom<n4>,
  19. #                           ufrm<n5>.
  20. #
  21. # Standard header:
  22. # ----------------
  23. #
  24. #   Apple, the Apple logo, and Macintosh are trademarks of Apple
  25. #   Computer, Inc., registered in the United States and other countries.
  26. #   Unicode is a trademark of Unicode Inc. For the sake of brevity,
  27. #   throughout this document, "Macintosh" can be used to refer to
  28. #   Macintosh computers and "Unicode" can be used to refer to the
  29. #   Unicode standard.
  30. #
  31. #   Apple makes no warranty or representation, either express or
  32. #   implied, with respect to these tables, their quality, accuracy, or
  33. #   fitness for a particular purpose. In no event will Apple be liable
  34. #   for direct, indirect, special, incidental, or consequential damages 
  35. #   resulting from any defect or inaccuracy in this document or the
  36. #   accompanying tables.
  37. #
  38. #   These mapping tables and character lists are subject to change.
  39. #   The latest tables should be available from the following:
  40. #
  41. #   <ftp://ftp.unicode.org/Public/MAPPINGS/VENDORS/APPLE/>
  42. #   <ftp://dev.apple.com/devworld/Technical_Documentation/Misc._Standards/>
  43. #
  44. #   For general information about Mac OS encodings and these mapping
  45. #   tables, see the file "README.TXT".
  46. #
  47. # Format:
  48. # -------
  49. #
  50. #   Three tab-separated columns;
  51. #   '#' begins a comment which continues to the end of the line.
  52. #     Column #1 is the Mac OS Gujarati code or code sequence
  53. #       (in hex as 0xNN or 0xNN+0xNN)
  54. #     Column #2 is the corresponding Unicode or Unicode sequence
  55. #       (in hex as 0xNNNN or 0xNNNN+0xNNNN).
  56. #     Column #3 is a comment containing the Unicode name or sequence
  57. #       of names. In some cases an additional comment follows the
  58. #       Unicode name(s).
  59. #
  60. #   The entries are in two sections. The first section is for pairs of
  61. #   Mac OS Gujarati code points that must be mapped in a special way.
  62. #   The second section maps individual code points.
  63. #
  64. #   Within each section, the entries are in Mac OS Gujarati code order.
  65. #
  66. #   Control character mappings are not shown in this table, following
  67. #   the conventions of the standard UTC mapping tables. However, the
  68. #   Mac OS Gujarati character set uses the standard control characters
  69. #   at 0x00-0x1F and 0x7F.
  70. #
  71. # Notes on Mac OS Gujarati:
  72. # -------------------------
  73. #
  74. #   Mac OS Gujarati is based on IS 13194:1991 (ISCII-91), with the
  75. #   addition of several punctuation and symbol characters. However,
  76. #   Mac OS Gujarati does not support the ATR (attribute) mechanism of
  77. #   ISCII-91.
  78. #
  79. # 1. ISCII-91 features in Mac OS Gujarati include:
  80. #
  81. #  a) Overloading of nukta
  82. #
  83. #     In addition to using the nukta (0xE9) like a combining dot below,
  84. #     nukta is overloaded to function as a general character modifier.
  85. #     In this role, certain code points followed by 0xE9 are treated as
  86. #     a two-byte code point representing a character which may be
  87. #     rather different than the characters represented by either of
  88. #     the code points alone. For example, the character GUJARATI OM
  89. #     (U+0AD0) is represented in ISCII-91 as candrabindu + nukta.
  90. #
  91. #  b) Explicit halant and soft halant
  92. #
  93. #     A double halant (0xE8 + 0xE8) constitutes an "explicit halant",
  94. #     which will always appear as a halant instead of causing formation
  95. #     of a ligature or half-form consonant.
  96. #
  97. #     Halant followed by nukta (0xE8 + 0xE9) constitutes a "soft
  98. #     halant", which prevents formation of a ligature and instead
  99. #     retains the half-form of the first consonant.
  100. #
  101. #  c) Invisible consonant
  102. #
  103. #     The byte 0xD9 (called INV in ISCII-91) is an invisible consonant:
  104. #     It behaves like a consonant but has no visible appearance. It is
  105. #     intended to be used (often in combination with halant) to display
  106. #     dependent forms in isolation, such as the RA forms or consonant
  107. #     half-forms.
  108. #
  109. #  d) Extensions for Vedic, etc.
  110. #
  111. #     The byte 0xF0 (called EXT in ISCII-91) followed by any byte in
  112. #     the range 0xA1-0xEE constitutes a two-byte code point which can
  113. #     be used to represent additional characters for Vedic (or other
  114. #     extensions); 0xF0 followed by any other byte value constitutes
  115. #     malformed text. Mac OS Gujarati supports this mechanism, but
  116. #     does not currently map any of these two-byte code points to
  117. #     anything.
  118. #
  119. # 2. Mac OS Gujarati additions
  120. #
  121. #   Mac OS Gujarati adds characters using the code points
  122. #   0x80-0x8A and 0x90.
  123. #
  124. # 3. Unused code points
  125. #   
  126. #   The following code points are currently unused, and are not shown
  127. #   here: 0x8B-0x8F, 0x91-0xA0, 0xAB, 0xAF, 0xC7, 0xCE, 0xD0, 0xD3,
  128. #   0xE0, 0xE4, 0xEB-0xEF, 0xFB-0xFF. In addition, 0xF0 is not shown
  129. #   here, but it has a special function as described above.
  130. #
  131. # Unicode mapping issues and notes:
  132. # ---------------------------------
  133. #
  134. # 1. Mapping the byte pairs
  135. #
  136. #   If one of the following byte values is encountered when mapping
  137. #   Mac OS Gujarati text - xA1, xAA, xDF, or 0xE8 - then the next
  138. #   byte (if there is one) should be examined. If the next byte is
  139. #   0xE9 - or also 0xE8, if the first byte was 0xE8 - then the byte
  140. #   pair should be mapped using the first section of the mapping
  141. #   table below. Otherwise, each byte should be mapped using the
  142. #   second section of the mapping table below.
  143. #
  144. #   - The Unicode Standard, Version 2.0, specifies how explicit
  145. #     halant and soft halant should be represented in Unicode;
  146. #     these mappings are used below.
  147. #
  148. #   If the byte value 0xF0 is encountered when mapping Mac OS 
  149. #   Gujarati text, then the next byte should be examined. If there
  150. #   is no next byte (e.g. 0xF0 at end of buffer), the mapping
  151. #   process should indicate incomplete character. If there is a next
  152. #   byte but it is not in the range 0xA1-0xEE, the mapping process
  153. #   should indicate malformed text. Otherwise, the mapping process
  154. #   should treat the byte pair as a valid two-byte code point with no
  155. #   mapping (e.g. map it to QUESTION MARK, REPLACEMENT CHARACTER,
  156. #   etc.).
  157. #
  158. # 2. Mapping the invisible consonant
  159. #
  160. #   It has been suggested that INV in ISCII-91 should map to ZERO
  161. #   WIDTH NON-JOINER in Unicode. However, this causes problems with
  162. #   roundtrip fidelity: The ISCII-91 sequences 0xE8+0xE8 and 0xE8+0xD9
  163. #   would map to the same sequence of Unicode characters. We have
  164. #   instead mapped INV to LEFT-TO-RIGHT MARK, which avoids these
  165. #   problems.
  166. #
  167. # Details of mapping changes in each version:
  168. # -------------------------------------------
  169. #
  170. ##################
  171.  
  172. # Section 1: Map the following byte pairs as indicated:
  173. # (ZWNJ means ZERO WIDTH NON-JOINER, ZWJ means ZERO WIDTH JOINER)
  174. # (Also see note about 0xF0 in comments above)
  175.  
  176. 0xA1+0xE9    0x0AD0    # GUJARATI OM
  177. 0xAA+0xE9    0x0AE0    # GUJARATI LETTER VOCALIC RR
  178. 0xDF+0xE9    0x0AC4    # GUJARATI VOWEL SIGN VOCALIC RR
  179. 0xE8+0xE8    0x0ACD+0x200C    # GUJARATI SIGN VIRAMA + ZWNJ    # explicit halant
  180. 0xE8+0xE9    0x0ACD+0x200D    # GUJARATI SIGN VIRAMA + ZWJ    # soft halant
  181.  
  182. # Section 2: Map the remaining bytes as follows:
  183.  
  184. 0x20    0x0020    # SPACE
  185. 0x21    0x0021    # EXCLAMATION MARK
  186. 0x22    0x0022    # QUOTATION MARK
  187. 0x23    0x0023    # NUMBER SIGN
  188. 0x24    0x0024    # DOLLAR SIGN
  189. 0x25    0x0025    # PERCENT SIGN
  190. 0x26    0x0026    # AMPERSAND
  191. 0x27    0x0027    # APOSTROPHE
  192. 0x28    0x0028    # LEFT PARENTHESIS
  193. 0x29    0x0029    # RIGHT PARENTHESIS
  194. 0x2A    0x002A    # ASTERISK
  195. 0x2B    0x002B    # PLUS SIGN
  196. 0x2C    0x002C    # COMMA
  197. 0x2D    0x002D    # HYPHEN-MINUS
  198. 0x2E    0x002E    # FULL STOP
  199. 0x2F    0x002F    # SOLIDUS
  200. 0x30    0x0030    # DIGIT ZERO
  201. 0x31    0x0031    # DIGIT ONE
  202. 0x32    0x0032    # DIGIT TWO
  203. 0x33    0x0033    # DIGIT THREE
  204. 0x34    0x0034    # DIGIT FOUR
  205. 0x35    0x0035    # DIGIT FIVE
  206. 0x36    0x0036    # DIGIT SIX
  207. 0x37    0x0037    # DIGIT SEVEN
  208. 0x38    0x0038    # DIGIT EIGHT
  209. 0x39    0x0039    # DIGIT NINE
  210. 0x3A    0x003A    # COLON
  211. 0x3B    0x003B    # SEMICOLON
  212. 0x3C    0x003C    # LESS-THAN SIGN
  213. 0x3D    0x003D    # EQUALS SIGN
  214. 0x3E    0x003E    # GREATER-THAN SIGN
  215. 0x3F    0x003F    # QUESTION MARK
  216. 0x40    0x0040    # COMMERCIAL AT
  217. 0x41    0x0041    # LATIN CAPITAL LETTER A
  218. 0x42    0x0042    # LATIN CAPITAL LETTER B
  219. 0x43    0x0043    # LATIN CAPITAL LETTER C
  220. 0x44    0x0044    # LATIN CAPITAL LETTER D
  221. 0x45    0x0045    # LATIN CAPITAL LETTER E
  222. 0x46    0x0046    # LATIN CAPITAL LETTER F
  223. 0x47    0x0047    # LATIN CAPITAL LETTER G
  224. 0x48    0x0048    # LATIN CAPITAL LETTER H
  225. 0x49    0x0049    # LATIN CAPITAL LETTER I
  226. 0x4A    0x004A    # LATIN CAPITAL LETTER J
  227. 0x4B    0x004B    # LATIN CAPITAL LETTER K
  228. 0x4C    0x004C    # LATIN CAPITAL LETTER L
  229. 0x4D    0x004D    # LATIN CAPITAL LETTER M
  230. 0x4E    0x004E    # LATIN CAPITAL LETTER N
  231. 0x4F    0x004F    # LATIN CAPITAL LETTER O
  232. 0x50    0x0050    # LATIN CAPITAL LETTER P
  233. 0x51    0x0051    # LATIN CAPITAL LETTER Q
  234. 0x52    0x0052    # LATIN CAPITAL LETTER R
  235. 0x53    0x0053    # LATIN CAPITAL LETTER S
  236. 0x54    0x0054    # LATIN CAPITAL LETTER T
  237. 0x55    0x0055    # LATIN CAPITAL LETTER U
  238. 0x56    0x0056    # LATIN CAPITAL LETTER V
  239. 0x57    0x0057    # LATIN CAPITAL LETTER W
  240. 0x58    0x0058    # LATIN CAPITAL LETTER X
  241. 0x59    0x0059    # LATIN CAPITAL LETTER Y
  242. 0x5A    0x005A    # LATIN CAPITAL LETTER Z
  243. 0x5B    0x005B    # LEFT SQUARE BRACKET
  244. 0x5C    0x005C    # REVERSE SOLIDUS
  245. 0x5D    0x005D    # RIGHT SQUARE BRACKET
  246. 0x5E    0x005E    # CIRCUMFLEX ACCENT
  247. 0x5F    0x005F    # LOW LINE
  248. 0x60    0x0060    # GRAVE ACCENT
  249. 0x61    0x0061    # LATIN SMALL LETTER A
  250. 0x62    0x0062    # LATIN SMALL LETTER B
  251. 0x63    0x0063    # LATIN SMALL LETTER C
  252. 0x64    0x0064    # LATIN SMALL LETTER D
  253. 0x65    0x0065    # LATIN SMALL LETTER E
  254. 0x66    0x0066    # LATIN SMALL LETTER F
  255. 0x67    0x0067    # LATIN SMALL LETTER G
  256. 0x68    0x0068    # LATIN SMALL LETTER H
  257. 0x69    0x0069    # LATIN SMALL LETTER I
  258. 0x6A    0x006A    # LATIN SMALL LETTER J
  259. 0x6B    0x006B    # LATIN SMALL LETTER K
  260. 0x6C    0x006C    # LATIN SMALL LETTER L
  261. 0x6D    0x006D    # LATIN SMALL LETTER M
  262. 0x6E    0x006E    # LATIN SMALL LETTER N
  263. 0x6F    0x006F    # LATIN SMALL LETTER O
  264. 0x70    0x0070    # LATIN SMALL LETTER P
  265. 0x71    0x0071    # LATIN SMALL LETTER Q
  266. 0x72    0x0072    # LATIN SMALL LETTER R
  267. 0x73    0x0073    # LATIN SMALL LETTER S
  268. 0x74    0x0074    # LATIN SMALL LETTER T
  269. 0x75    0x0075    # LATIN SMALL LETTER U
  270. 0x76    0x0076    # LATIN SMALL LETTER V
  271. 0x77    0x0077    # LATIN SMALL LETTER W
  272. 0x78    0x0078    # LATIN SMALL LETTER X
  273. 0x79    0x0079    # LATIN SMALL LETTER Y
  274. 0x7A    0x007A    # LATIN SMALL LETTER Z
  275. 0x7B    0x007B    # LEFT CURLY BRACKET
  276. 0x7C    0x007C    # VERTICAL LINE
  277. 0x7D    0x007D    # RIGHT CURLY BRACKET
  278. 0x7E    0x007E    # TILDE
  279. #
  280. 0x80    0x00D7    # MULTIPLICATION SIGN
  281. 0x81    0x2212    # MINUS SIGN
  282. 0x82    0x2013    # EN DASH
  283. 0x83    0x2014    # EM DASH
  284. 0x84    0x2018    # LEFT SINGLE QUOTATION MARK
  285. 0x85    0x2019    # RIGHT SINGLE QUOTATION MARK
  286. 0x86    0x2026    # HORIZONTAL ELLIPSIS
  287. 0x87    0x2022    # BULLET
  288. 0x88    0x00A9    # COPYRIGHT SIGN
  289. 0x89    0x00AE    # REGISTERED SIGN
  290. 0x8A    0x2122    # TRADE MARK SIGN
  291. #
  292. 0x90    0x0965    # DEVANAGARI DOUBLE DANDA
  293. #
  294. 0xA1    0x0A81    # GUJARATI SIGN CANDRABINDU
  295. 0xA2    0x0A82    # GUJARATI SIGN ANUSVARA
  296. 0xA3    0x0A83    # GUJARATI SIGN VISARGA
  297. 0xA4    0x0A85    # GUJARATI LETTER A
  298. 0xA5    0x0A86    # GUJARATI LETTER AA
  299. 0xA6    0x0A87    # GUJARATI LETTER I
  300. 0xA7    0x0A88    # GUJARATI LETTER II
  301. 0xA8    0x0A89    # GUJARATI LETTER U
  302. 0xA9    0x0A8A    # GUJARATI LETTER UU
  303. 0xAA    0x0A8B    # GUJARATI LETTER VOCALIC R
  304. #
  305. 0xAC    0x0A8F    # GUJARATI LETTER E
  306. 0xAD    0x0A90    # GUJARATI LETTER AI
  307. 0xAE    0x0A8D    # GUJARATI VOWEL CANDRA E
  308. #
  309. 0xB0    0x0A93    # GUJARATI LETTER O
  310. 0xB1    0x0A94    # GUJARATI LETTER AU
  311. 0xB2    0x0A91    # GUJARATI VOWEL CANDRA O
  312. 0xB3    0x0A95    # GUJARATI LETTER KA
  313. 0xB4    0x0A96    # GUJARATI LETTER KHA
  314. 0xB5    0x0A97    # GUJARATI LETTER GA
  315. 0xB6    0x0A98    # GUJARATI LETTER GHA
  316. 0xB7    0x0A99    # GUJARATI LETTER NGA
  317. 0xB8    0x0A9A    # GUJARATI LETTER CA
  318. 0xB9    0x0A9B    # GUJARATI LETTER CHA
  319. 0xBA    0x0A9C    # GUJARATI LETTER JA
  320. 0xBB    0x0A9D    # GUJARATI LETTER JHA
  321. 0xBC    0x0A9E    # GUJARATI LETTER NYA
  322. 0xBD    0x0A9F    # GUJARATI LETTER TTA
  323. 0xBE    0x0AA0    # GUJARATI LETTER TTHA
  324. 0xBF    0x0AA1    # GUJARATI LETTER DDA
  325. 0xC0    0x0AA2    # GUJARATI LETTER DDHA
  326. 0xC1    0x0AA3    # GUJARATI LETTER NNA
  327. 0xC2    0x0AA4    # GUJARATI LETTER TA
  328. 0xC3    0x0AA5    # GUJARATI LETTER THA
  329. 0xC4    0x0AA6    # GUJARATI LETTER DA
  330. 0xC5    0x0AA7    # GUJARATI LETTER DHA
  331. 0xC6    0x0AA8    # GUJARATI LETTER NA
  332. #
  333. 0xC8    0x0AAA    # GUJARATI LETTER PA
  334. 0xC9    0x0AAB    # GUJARATI LETTER PHA
  335. 0xCA    0x0AAC    # GUJARATI LETTER BA
  336. 0xCB    0x0AAD    # GUJARATI LETTER BHA
  337. 0xCC    0x0AAE    # GUJARATI LETTER MA
  338. 0xCD    0x0AAF    # GUJARATI LETTER YA
  339. #
  340. 0xCF    0x0AB0    # GUJARATI LETTER RA
  341. #
  342. 0xD1    0x0AB2    # GUJARATI LETTER LA
  343. 0xD2    0x0AB3    # GUJARATI LETTER LLA
  344. #
  345. 0xD4    0x0AB5    # GUJARATI LETTER VA
  346. 0xD5    0x0AB6    # GUJARATI LETTER SHA
  347. 0xD6    0x0AB7    # GUJARATI LETTER SSA
  348. 0xD7    0x0AB8    # GUJARATI LETTER SA
  349. 0xD8    0x0AB9    # GUJARATI LETTER HA
  350. 0xD9    0x200E    # LEFT-TO-RIGHT MARK    # invisible consonant
  351. 0xDA    0x0ABE    # GUJARATI VOWEL SIGN AA
  352. 0xDB    0x0ABF    # GUJARATI VOWEL SIGN I
  353. 0xDC    0x0AC0    # GUJARATI VOWEL SIGN II
  354. 0xDD    0x0AC1    # GUJARATI VOWEL SIGN U
  355. 0xDE    0x0AC2    # GUJARATI VOWEL SIGN UU
  356. 0xDF    0x0AC3    # GUJARATI VOWEL SIGN VOCALIC R
  357. #
  358. 0xE1    0x0AC7    # GUJARATI VOWEL SIGN E
  359. 0xE2    0x0AC8    # GUJARATI VOWEL SIGN AI
  360. 0xE3    0x0AC5    # GUJARATI VOWEL SIGN CANDRA E
  361. #
  362. 0xE5    0x0ACB    # GUJARATI VOWEL SIGN O
  363. 0xE6    0x0ACC    # GUJARATI VOWEL SIGN AU
  364. 0xE7    0x0AC9    # GUJARATI VOWEL SIGN CANDRA O
  365. 0xE8    0x0ACD    # GUJARATI SIGN VIRAMA    # halant
  366. 0xE9    0x0ABC    # GUJARATI SIGN NUKTA
  367. 0xEA    0x0964    # DEVANAGARI DANDA
  368. #
  369. 0xF1    0x0AE6    # GUJARATI DIGIT ZERO
  370. 0xF2    0x0AE7    # GUJARATI DIGIT ONE
  371. 0xF3    0x0AE8    # GUJARATI DIGIT TWO
  372. 0xF4    0x0AE9    # GUJARATI DIGIT THREE
  373. 0xF5    0x0AEA    # GUJARATI DIGIT FOUR
  374. 0xF6    0x0AEB    # GUJARATI DIGIT FIVE
  375. 0xF7    0x0AEC    # GUJARATI DIGIT SIX
  376. 0xF8    0x0AED    # GUJARATI DIGIT SEVEN
  377. 0xF9    0x0AEE    # GUJARATI DIGIT EIGHT
  378. 0xFA    0x0AEF    # GUJARATI DIGIT NINE
  379.